Zum Inhalt springen

Online-Betrug Software erkennt falsche Internet-Bewertungen

Eine gute Geschichte und gefälschte Empfehlungen im Internet haben etwas gemeinsam: Sie fallen durch blumige Sprache und viele Verben auf. Forscher einer US-Universität wollen so Bewertungsspam im Internet aufspüren.
Spam (Symbolbild): Gefälschte Bewertungen fallen durch blumige Sprache auf

Spam (Symbolbild): Gefälschte Bewertungen fallen durch blumige Sprache auf

Foto: Corbis

Hamburg - Ist das Hotel komfortabel, schmeckt das Essen im Restaurant um die Ecke? Zahlreiche Portale im Netz versammeln mehr oder weniger Aussagekrätige Meinungen. Das Problem daran: Nicht selten schreiben sich die Anbieter ihre Qualitätsurteile einfach selber oder kaufen positive Bewertungen im Dutzend bei einschlägigen Anbietern.

Forscher der Cornell University im US-Bundesstaat New York wollen Abhilfe schaffen: Sie haben eine Software entwickelt, die echte von gefälschten Bewertungen unterscheiden können soll. Eine erste Version hat die Gruppe um die Professoren Claire Cardie und Jeff Hancock bereits im Juni präsentiert. Für den Testlauf wurden 800 Hotel-Bewertungen in Chicago in das System eingespeist, darunter eigens erstellte Fälschungen.

In 90 Prozent der Fälle habe das Programm die Fälschungen erkannt, heißt es in einer Mitteilung der Universität . Die Software führt dazu eine Sprachanalyse durch und sucht nach bestimmten Begriffen und Begriffskombinationen. In echten Bewertungen würden häufiger konkrete Begriffe wie "Badezimmer", "Check-in" oder "Preis" vorkommen. Fälschungen fielen hingegen durch Beschreibungen wie "Urlaub", "Geschäftsreise" oder "mein Ehemann" auf. Mehr Verben deuten auf Fälschungen hin, ehrliche Bewertungen würden mehr Nomen enthalten.

Die Software soll sich den Forschern zufolge weniger häufig von beschreibender Sprache, wie sie auch in Romanen verwendet wird, austricksen lassen als Menschen. Als nächstes wollen die Forscher ihren Algorithmus auf andere Kategorien ausweiten.

Suchmaschinen wie Google halten ihre Routinen zur Erkennung von Fälschungen geheim: Sind die Paramter erst einmal in der Welt, könnten die Erkenntnisse von Spammern zur Erstellung von Fälschungen genutzt werden, die auch eine noch so gute Software nicht mehr als solche identifizieren kann.

ore